Un enfoque gramatical para la extracción de términos índice

نویسندگان

  • Jesús Vilares
  • Miguel A. Alonso
چکیده

The extraction of the keywords that characterize a document in a given collection is one of the most important components of an Information Retrieval system. In this article, we propose to apply shallow parsing, implemented by means of cascades of finite-state transducers, to extract complex index terms based on an approximated grammar of Spanish. The coverage of the grammar is small but it allows us to extract the words involved in the most relevant syntactic dependencies. The effectiveness of the extracted index terms has been evaluated in the CLEF collection of Spanish texts.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Extracción automática de contextos definitorios en textos especializados

Uno de los problemas recurrentes de cualquier área de conocimiento es la organización y explicación de los términos que incluye en su campo de estudio. El reciente avance en el desarrollo de nuevas tecnologías para el trabajo terminológico ha aportado diversas herramientas para tratar de resolver este problema. Una de estas herramientas son los corpus de textos especializados en los cuales se p...

متن کامل

Una Propuesta para el Etiquetado Automático de Roles Semánticos

Resumen: La identificación de los roles semánticos es una parte crucial en tareas que involucran tratamiento automático del lenguaje natural como la extracción y recuperación de información, sistemas de búsquedas de respuestas, generación de resúmenes, traducción automática, etc. Para el caso del español, la investigación en roles semánticos es escasa. El objetivo del actual trabajo es analizar...

متن کامل

Sobre la Diferencia entre Análisis y Diseño, y Por Qué es Relevante Para la Transformación de Modelos

Resumen. En este artículo intentamos clarificar las confusiones que encontramos en torno a los términos “modelo de análisis” y “modelo de diseño”, ampliamente usados en ingeniería del software. En nuestra experiencia, estas confusiones son la raíz de algunas dificultades que los profesionales encuentran al modelar, y que en ocasiones conducen a malas prácticas de ingeniería. Nuestro enfoque con...

متن کامل

Control basado en PID inteligentes: aplicación al control de crucero de un vehículo a bajas velocidades

Resumen: A pesar de sus limitaciones, la técnica de control mas utilizada en el mundo industrial sigue siendo todavía hoy el control PID. En este artículo se presenta un nuevo enfoque, el control basado en PID inteligentes (i-PID), que aprovecha las virtudes que han hecho tan popular al PID, mejorando uno de sus puntos débiles: la perdida de prestaciones en presencia de términos no-lineales o d...

متن کامل

Poblado automático de ontologías de perfiles académicos a partir de textos en español

Resumen. Este artículo propone un enfoque para el poblado automático de ontologías de perfiles académicos a partir de los textos, expedientes curriculares y resúmenes, de publicaciones científicas en español. El enfoque utiliza reglas semánticas y marcadores lingüísticos para extraer los individuos de clase, relaciones y valores de propiedad. Una evaluación ha sido realizada con un conjunto de ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 31  شماره 

صفحات  -

تاریخ انتشار 2003